1.什麼是機器學習
Arthur Samuel (1959): 一門不需要通過外部程序指示而讓電腦有能力自我學習的學科
Tom Mickell (1997): “針對經驗E(experience) 和一系列的任務T (tasks) 和一定表現的衡量 P,如果隨著經驗E的積累,針對定義好的任務T可以提高表現P,就說電腦具有學習能力”
總之,機器學習是一個電腦程序,針對某個特定的任務,從經驗中學習,並且越做越好。
2.機器學習的要素
數據
經驗最終要轉換為電腦能理解的數據,這樣電腦才能從經驗中學習。誰掌握的數據量大、質量高,誰就占據了機器學習領域最有利的資本。
模型
即算法,有了數據之後,可以設計一個模型,讓數據做為輸入來訓練這個模型。經過訓練的模型,最終就成了機器學習的核心,使得模型成為了能產生決策的中樞。
3.機器學習解決什麼問題
分類問題 ---根據數據樣本上抽取出的特徵,判定其屬於**有限個類別**中的哪一個
垃圾郵件識別 --- 垃圾郵件? 正常郵件 ?
圖像識別 --- 貓? 狗? 老虎?
回歸問題 --- 根據數據樣本上抽取出的特徵,預測一個**連續值的結果**
機器學習就是世界上最強的函數逼近器
台北2個月後的房價
電影的票房
聚類問題 --- 根據數據樣本上抽取出的特徵,讓**樣本抱抱團**(相近/相關的樣本在一團內)
今日頭條的新聞分類
用戶群體化分